查看原文
其他

LEfSe分析最详攻略来袭,不了解你就亏大了!|微生物专题

运营部-LQQ 联川生物 2024-03-27

做微生态研究的小伙伴对LEfSe差异分析肯定不陌生,这也是大家在文献中使用频率的最高的菌群差异分析方法了,截止目前,LEfSe分析文献已被引用6393次了,从这个数字您就更能体会到广大科研工作者对于这个分析的认可度有多高了。

 



那今天我们就跟小编再系统的学习一下LEfSe分析吧!

LEfSe(LDA Effect Size)分析,可以用于两个或多个分组之间的比较,从而找到组间有显著性差异 的物种(即 biomarker),分析步骤主要分为三步:



Step1:利用 Kruskal-Wallis 秩和检验检测所有的特征物种,通过检测不同组间的物种丰度差异, 获得显著性差异物种。

Step2:再利用 Wilcoxon 秩和检验检测上步获得的显著性差异物种的所有亚种是否都趋同于同一分 类级别。

Step3:最后用线性判别分析(LDA),得到最终的差异物种(即 biomarker)。







(Segata N,et al.2011)




输出结果解读

LEfSe分析的输出结果文件一般有:

Group_A_vs_B_0.05_4.0(0.05为设定的P值阈值,4.0为设定的LDA阈值)

├── LEfSe_Group_A_vs_B.biomarkers.zip   各差异物种丰度柱状图(一个差异物种一张图)

├── LEfSe_Group_A_vs_B.cladogram.pdf    进化分支图

├── LEfSe_Group_A_vs_B.cladogram.png    进化分支图

├── LEfSe_Group_A_vs_B.pdf     分布柱状图

├── LEfSe_Group_A_vs_B.png     分布柱状图

├── LEfSe_Group_A_vs_B.res     差异分析结果

└── LEfSe_Group_A_vs_B.xlsx    相对丰度表格


 各文件说明:

(1)LEfSe_Group_A_vs_B.res


各列意义如下:


注:该文件可以用 Excel 打开,通过筛选第三列非空值的行即可获得所有 biomarker 的信息,并获得具体的 P 值和 LDA 得分。

(2)LEfSe_Group_A_vs_B.cladogram.pdf/png 是基于 res 分析结果绘制的进化分支图。

 


图片解读:不同圆圈表示不同分类层级,从内至外,依次为界-门-纲-目-科-属-种。每个节点表示一种物种,节点越大,表示该物种丰度越高,其中黄色表示该物种在两组中无显著性差异,其他颜色,以红色为例,如果节点颜色为红色则表示该物种具有显著性差异,且该物种在 A组中的丰度更高,其他颜色以此类推。所有的差异物种以字母表示,每个字母具体代表的物种在右侧图例中标出。由于考虑到篇幅的原因,右侧图例仅展示门到属水平的差异物种。

(3)LEfSe_Group_A_vs_B.pdf/png 基于 res 分析结果绘制的分布柱状图。

图片解读:分布柱状图主要为我们展示了 LDA score 大于预设值的显著差异物种,即具有统计学差异的 Biomaker,默认预设值为 4.0(看横坐标,只有 LDA 值的绝对值大于 4 才会显示在图中);柱状图的颜色代表各差异物种所富集的组别,柱子的长度代表的是 LDA score的大小,即不同组间显著差异物种的影响程度。 

(4)LEfSe_Group_A_vs_B.xlsx 为 A 和 B 两组中每个样本七个层级物种的相对丰度。

(5)LEfSe_Group_A_vs_B.biomarkers.zip 为每个 biomarker 在两个组的不同样本中的相对丰度情况,如下图就是 g__Candidatus_Tenderia 物种在 A 和 B两组每个样本中的相对丰度情况。

 


其中横坐标为样本名称,纵坐标为相对丰度,左边为A组,右边为 B组。





LEfSe分析云工具使用

当您拿到测序公司给您的标准分析结果时经常会遇到筛选到的 biomarker 过多或过少的情况,主要是由于标准分析一般会统一设定阈值(比如我们公司默认设置的阈值为LDA>3,P<0.05),不一定对所有的项目结果都适用。这时候您可以通过提高 LDA 值或降低 p 值来减少筛选到的 biomarker 数量,或通过降低 LDA 值增加筛选到 biomarker 的数量。

LEfSe的官方在线分析虽然看起来操作简单,但是很多同学在使用过程中还是多多少少遇到了一些困难,例如全英文的界面,还有复杂层级的输入文档,让人还没开始就想要放弃。那您就可以用我们公司云平台-云工具中的 LEfSe分析 (https://www.omicstudio.cn/tool/60)通过调整参数重新分析绘图。(偷偷告诉你,近期我们还新增了设定分组顺序的功能哦!Ps:这个是大多数客户心心念念的需求呢!) 


 


01 输入文件准备

如果您有在联川做项目,您可以直接上传我们标准分析summary结果中的文件:

输入文件1:summary/6_taxonomy_community/ASV_table_with_taxonomy.xlsx


注:第一列为ASV ID,最后一列为各ASV ID对应的7个层级的物种注释信息,各层级以英文状态的分号隔开,中间的列为各ASV ID的丰度信息。

输入文件2:summary/1_raw_data/sample_map.xlsx

 


注:第一列为样本名称,需要与输入文件1的样本名称一一对应,第二列为分组信息。需要注意的是,列名必须与示例文件的列名一致。

如果您不是我们公司的客户,放心,您也可以按照上面的示例文件的格式整理输入文件后进行绘图,而且是免费不限次数的哦!


                              

02 输入文件上传


首先打开联川生物云平台LEfSe云工具:https://www.omicstudio.cn/tool/60

然后进入分析页面,选择左侧 开始绘制 按钮。

打开页面右上方 绘图数据的“+”,然后分别上传 输入文件1 和输入文件2 共两张表格,可以下载示例数据看下格式,这两张表格在一般的微生物测序的结果文件都是有的。




 


03 Lda Effective Size (LEfSe)差异计算

勾选需要进行差异分析的组别,设置差异阈值,然后点击 开始计算,即可得到LEfSe分析结果表格,温馨提醒一下序列条目很多的话,需要耐心等待下。


 


04 进化分支图的绘制

设置左侧进化分支图的相关参数,然后点击开始绘图,稍作等待,即可完成图片绘制。





05 分布柱状图绘制


设置左侧分布柱状图的相关参数,然后点击开始绘图,稍作等待,即可完成图片绘制。


 



除了这样基础的分析外,实际上还有更高阶的玩法,跟着下面的操作您也能拥有!



情景1:只绘制其中一个或几个层级的分布柱状图

第一步:打开标准分析的summary/8_advanced_analyse/2_biomarkers_analysis/2_LEfSe_result/Group_A_vs_B_0.05_3.0/LEfSe_Group_A_vs_B.res文件或云工具的输出表格Table_diff_Data_res.xlsx

在Biomarker_names列(H列)前插入7列,复制Biomarker_names列信息到第一列(A列),如下图所示:

 

第二步:对第一列按照 . 进行分列(可参考下图步骤进行分列)。


分列结束后得到如下图所示的文件。


第三步:比如您要绘制仅展示属水平的分布柱状图,您可筛选种水平列为空,属水平列不为空的行。其他层级类似,例如门水平就可以筛选门水平不为空,纲目科属种列为空的行。

 

第四步:然后复制粘贴保存H列至L列至新的excel表格。 


第五步:进入云平台-云工具-LEfSe云工具(https://www.omicstudio.cn/tool/60),点击LEfSe绘图数据上传。按照下图顺序依次操作上传文件。 


第六步:由于仅展示一个层级只需要绘制分布柱状图,所以直接在Step4.图片绘制-分布柱状图中点击【开始绘制-分布柱状图】,稍等片刻,即可在Step5.结果展示中看到我们绘制的图片。




情景2:绘制仅展示具有显著性差异物种的进化分支图

打开标准分析的summary/8_advanced_analyse/2_biomarkers_analysis/2_LEfSe_result/Group_A_vs_B_0.05_3.0/LEfSe_Group_A_vs_B.res文件然后筛选D列(LDA_values)不为空的行,复制粘贴至新的excel表格中作为输入文件,或直接使用云工具的差异分析结果

Table_diff_Data_res.xlsx作为输入文件。

最后按照情景1中的第五步上传新的excel表格至云工具,在【Step3.图片绘制-进化分支图】中点击【开始绘制-进化分支图】就可以绘制进化分析图,即可在Step5.结果展示中看到我们绘制的图片。

 




情景3 计算功能通路差异,绘制分布柱状图

LEfSe分析不仅仅限于进行物种差异的计算,实际上对于功能通路的丰度也是可以计算差异的,只是需要在整理输入文件时保持第一列和最后一列一致就可以。

 


看这里,您是不是已经迫不及待想拿自己的数据想到云工具中进行自己的LEfSe首秀了!体验完您就会发现这款云工具有多么的好用和贴心,忍不住想要推荐给身边的朋友们。如果您对该云工具还有其他的需求,欢迎您来信(support@lc-bio.com)告知,让我们一起打造一个属于大家的LEfSe分析吧!



参考文献:Segata N, Izard J, Waldron L, Gevers D, Miropolsky L, Garrett WS, Huttenhower C. Metagenomic biomarker discovery and explanation. Genome Biol. 2011 Jun 24;12(6):R60. doi: 10.1186/gb-2011-12-6-r60. PMID: 21702898; PMCID: PMC3218848.




相关阅读

全长16S结合多组学助力不同领域微生物组研究 | 微生物专题
LNA-16S测序鉴定植物内生细菌占比高达99% | 微生物专题
史上最全的肠道菌群研究数据库,建议收藏!|微生物专题
官宣CP!肿瘤微生物组 × 外显子组 | 微生物专题



点击下方图片进入云平台资料汇总:

所见即所得,绘图高规格联川云平台,让科研更自由



继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存